Extraction de motifs fermés dans des relations n-aires bruitées

نویسندگان

  • Loïc Cerf
  • Jérémy Besson
  • Jean-François Boulicaut
چکیده

La fouille de relations binaires a été très étudiée via notamment les usages multiples des ensembles fermés fréquents. Cependant, il est courant que les données à traiter se représentent dans des relations n-aires avec n ≥ 3 et il semble donc naturel de vouloir étendre le calcul de motifs fermés dans ce contexte (Ji et al., 2006; Jaschke et al., 2006; Cerf et al., 2008b). Dans le cas des relations binaires (calcul de 2-ensembles fermés ou concepts formels selon (Ganter et al., 2005)), nous savons que le nombre et la qualité des motifs extraits sont déjà problématiques. De nombreuses raisons (e.g., une erreur de mesure) peuvent mener à l’absence d’un couple dans la relation et un « véritable » motif donne lieu à plusieurs motifs fermés distincts et plus petits : quand la quantité de bruit augmente, le nombre de motifs fermés explose et leur pertinence se dégrade. Cette situation empire dramatiquement lorsque l’arité de la relation à fouiller augmente. Nous introduisons ici un algorithme de calcul de tous les motifs fermés ayant un nombre borné d’exceptions par élément (de n’importe quel attribut) sur n’importe quelle relation n-aire. Cet article est une version courte de (Cerf et al., 2008a).

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Extraction de motifs n-aires utilisant la PPC

Dans cet article, nous proposons une approche PPC permettant d’extraire des motifs n-aires (i.e. combinant plusieurs motifs locaux) en fouille de données. Dans un premier temps, l’utilisateur modélise sa requête à l’aide de contraintes portant sur plusieurs motifs locaux. Puis, un solveur de contraintes génère l’ensemble correct et complet des solutions. Notre approche permet de modéliser de ma...

متن کامل

Description structurelle automatique de documents musicaux

Une nouvelle méthodologie d’extraction de motifs répétés au sein de partitions musicales est présentée. L’automatisation de la recherche de répétitions permet un approfondissement de l’analyse musicale, et rend possible la conception d’outils de gestion des masses de données musicales. L’approche proposée consiste en une explicitation des facteurs de redondance structurelle sousjacents à une te...

متن کامل

Extraction de motifs séquentiels. Problèmes et méthodes

SYNOPSIS. Dans un premier temps, le problème de l’extraction de motifs séquentiels peut sembler proche de celui de l’extraction de règles d’association. Ce rapprochement s’avère cependant très fragile en raison d’un élément clé qui est propre à l’extraction de motifs séquentiels : la temporalité. Cette notion permet à la fois de distinguer à l’intérieur des enregistrements un ordre d’apparition...

متن کامل

Extraction de concepts sous contraintes dans des données d'expression de gènes

L’une des activités les plus importantes en biologie est l’analyse des données d’expression de gènes. Les biologistes espèrent ainsi mieux comprendre les fonctions des gènes et leurs interactions. Nous étudions dans cet article une technique permettant d’aider à l’analyse de ces données d’expression : l’extraction de concepts sous contraintes. Pour cela, nous proposons d’extraire des fermés sou...

متن کامل

Extraction de motifs temporels pour la détection dynamique de conflits ethno-politiques

Résumé. Nous présentons une réalisation en cours sur l'extraction de motifs temporels à partir de séquences d'événements dans le cadre de la détection dynamique des conflits ethno-politiques. Notre contexte d'application présente plusieurs difficultés : le phénomène que l'on cherche à modéliser est fortement variable et les données sont bruitées. Mais nous disposons d'une connaissance a priori ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2009